moe科幻影视_第3页

开发者故事 | 基于 DOCA GPUNetIO 的 MoE 模型推理加速实践

在第三届 NVIDIA DPU 中国黑客松竞赛中，我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中，有 5 支队伍脱颖而出，展现了在 AI 网络、存储和安全等领域的创新突破。

推理 moe moe模型 gpunetio doca 2025-09-17 18:23 16

6.1B打平40B Dense模型，蚂蚁开源最新MoE模型Ling-flash-2.0

今天，蚂蚁百灵大模型团队正式开源其最新 MoE 大模型 ——Ling-flash-2.0。作为 Ling 2.0 架构系列的第三款模型，Ling-flash-2.0 以总参数 100B、激活仅 6.1B（non-embedding 激活 4.8B）的轻量级配置

模型开源 moe moe模型 dense模型 2025-09-17 17:35 15

AI云玩家洗牌时刻，百度智能云凭什么六连冠？

AI在企业内部应用的场景多了之后，一到业务峰值，用户并发涌上来，要是调度系统不给力、加速引擎没提效、KVCache优化不到位，服务一旦卡壳，不仅用户体验崩了，还会带来业务损失；

玩家百度 moe 智能云智能云凭什么 2025-09-17 15:39 17

豆包为什么能反超DeepSeek？

中国AI应用市场迎来历史性转折点，字节跳动旗下豆包月活跃用户规模达到1.5742亿，环比增长6.6%，一举超越此前领先的DeepSeek，登顶中国原生AI应用月活榜首（据QuestMobile发布的2025年8月AI应用行业月度报告显示）。

飞轮豆包字节 deepseek moe 2025-09-16 20:43 13

冲破 AGI 迷雾，蚂蚁看到了一个新路标

2024年12月14日，温哥华会展中心座无虚席，ChatGPT之父 Ilya 现身大银幕，在全球 AI 顶会上， Ilya 向全行业预警：

蚂蚁 agi moe agi迷雾崇轩 2025-09-16 20:27 15

豆包月活用户超越DeepSeek

9月16日，QuestMobile发布的2025年8月AI应用行业月度报告显示，当月，豆包以6.6%的环比增速达到1.57亿应用规模，反超DeepSeek，重新回归原生App阵营月活跃用户规模TOP1。

豆包插件 deepseek moe 月活 2025-09-16 19:33 17

豆包月活用户超越DeepSeek，登顶8月中国原生AI APP榜首

9月16日，QuestMobile发布的2025年8月AI应用行业月度报告显示，当月，豆包以6.6%的环比增速达到1.57亿应用规模，反超DeepSeek，重新回归原生App阵营月活跃用户规模TOP1。

豆包 app deepseek moe 月活 2025-09-16 15:22 16

全新开源 Qwen3-Next：MoE 架构在 NVIDIA 平台实现高精度与推理加速

为展示未来趋势，阿里巴巴发布了[1] 两款新开源模型 —— Qwen3-Next 80B-A3B-Thinking 与 Qwen3-Next 80B-A3B-Instruct，为研究者和开发者社区提供对新型混合专家模型 (MoE) 架构的预览。

推理开源 nvidia moe moe架构 2025-09-15 18:34 16

阿里Qwen3-Next发布，训练成本暴降90%，速度飙升10倍，性能把谷歌Gemini干懵了

阿里通义团队正式发布并开源了下一代基础模型架构Qwen3-Next，以及基于这个架构的Qwen3-Next-80B-A3B系列模型。这玩意儿有多炸裂呢？一个总参数量高达800亿的巨无霸模型，跑起来的时候居然只激活区区30亿参数，性能却能直接对标自家2350亿参

训练 gemini 谷歌 moe 谷歌gemini 2025-09-15 13:51 16

MXFP4量化：如何在80GB GPU上运行1200亿参数的GPT-OSS模型

大型语言模型（Large Language Models, LLMs）如GPT-OSS、GPT-4、LLaMA和Mixtral的快速发展显著提升了人工智能的能力边界，但同时也带来了严峻的内存资源挑战。以1200亿参数的模型为例，在FP16精度下仅权重存储就需要

模型 gpu moe 内存带宽 mxfp4 2025-09-14 07:08 14

双榜登顶！ERNIE-4.5-21B-A3B-Thinking 霸榜HuggingFace

据 HuggingFace 官网最新数据显示，截至 2025 年 9 月 12 日，百度最新开源的文心思考模型 ERNIE-4.5-21B-A3B-Thinking在 HuggingFace 全球模型总趋势榜和文本模型趋势榜均排名第一。

模型文心开源 moe huggingface 2025-09-13 10:06 18

一刀砍掉90%训练成本！Qwen3-Next用1/10算力练成「长文推理利器」

开源炸场！Qwen3-Next 80B，每次仅激活约3B；训练成本约1/10，32K以上长文本吞吐提升约10倍，原生256K。这才是开源最想看的答案。

训练推理 moe 长文闭源 2025-09-12 22:27 14

异动！ 600977 ，6天3涨停！

午后，影视股走强，中国电影尾盘涨停走出6天3板，此前金逸影视3连板，幸福蓝海涨超12%，文投控股、北京文化、华谊兄弟、博纳影业、中视传媒跟涨。

moe 涨停激素受体中视传媒中核钛白 2025-09-12 16:16 20

蚂蚁联手人大发布首个原生MoE扩散语言模型

9月11日，在2025Inclusion·外滩大会上，蚂蚁集团与中国人民大学联合发布业界首个原生MoE架构的扩散语言模型（dLLM）“LLaDA-MoE”。

模型蚂蚁 moe 人大原生moe 2025-09-12 15:27 25

蚂蚁集团与人大发布首个原生MoE扩散语言模型，将于近期开源

9月11日，在2025Inclusion·外滩大会上，蚂蚁集团与中国人民大学联合发布业界首个原生MoE架构的扩散语言模型（dLLM）“LLaDA-MoE”，中国人民大学高瓴人工智能学院副教授李崇轩，蚂蚁集团通用人工智能研究中心主任、西湖大学特聘研究员、西湖心辰

模型开源蚂蚁 moe 原生moe 2025-09-12 10:30 17

阿里深夜干了件大事，成本暴降90%！

今天凌晨，阿里通义实验室正式发布下一代基础模型架构Qwen3-Next，并训练了基于该架构的Qwen3-Next-80B-A3B-Base模型，该模型拥有800亿个参数仅激活30亿个参数。

推理 moe qwen3 mtp token 2025-09-12 12:16 18

「蚂蚁与中国人民大学发布首个原生MoE扩散语言模型」在20

在2025Inclusion·外滩大会上，蚂蚁集团与中国人民大学联合发布业界首个原生MoE架构的扩散语言模型（dLLM）“LLaDA-MoE”。LLaDA-MoE在约20T数据上完成了从零训练MoE架构的扩散语言模型，验证了工业级大规模训练的扩展性和稳定性。模

模型中国人民大学蚂蚁 moe 原生moe 2025-09-12 10:56 17

阿里深夜干了件大事，成本暴降90%

今天凌晨，阿里通义实验室正式发布下一代基础模型架构Qwen3-Next，并训练了基于该架构的Qwen3-Next-80B-A3B-Base模型，该模型拥有800亿个参数，仅激活30亿个参数。

推理 moe qwen3 mtp token 2025-09-12 10:42 15

2000tokens秒？这款游戏让策略操作快人一步

“处理200页PDF要多久？”用传统模型得3分钟，用最新的Qwen模型只要10秒——最近科技圈被这个对比刷屏了。2000tokens/秒的处理速度，不仅是数字的突破，更意味着AI能在更多“即时场景”里大显身手：实时翻译、毫秒级代码补全、客服秒回消息……技术的“

模型游戏策略 moe 快人一步 2025-09-12 11:06 23

蚂蚁集团联合中国人民大学发布首个原生MoE扩散语言模型

9月11日，在2025外滩大会上，蚂蚁集团与中国人民大学联合发布业界首个原生MoE架构的扩散语言模型(dLLM)“LLaDA-MoE”。实验数据显示，LLaDA-MoE模型性能效果在代码、数学、Agent等任务上领先于LLaDA1.0/1.5和Dream-7B

模型中国人民大学蚂蚁 moe 原生moe 2025-09-12 10:52 17